智能论文笔记

Computational Empathy Counteracts the Negative Effects of Anger on Creative Problem Solving

Matthew Groh , Craig Ferguson , Robert Lewis , Rosalind Picard

分类：人工智能

2022-08-15

移情如何影响创造性问题解决？我们引入了基于上下文特定的情感模仿和透视图的计算同理干预，以良好的北极熊的形式出现了虚拟药物的观点。在与1,006名参与者进行的在线实验中，随机分配到情绪启发干预（具有控制的启发条件和愤怒启发条件）和计算同理心干预（具有控制虚拟代理和移情虚拟药物）中，我们研究了愤怒和移情的影响参与者在基于Wordle的单词游戏中的表现。我们发现，分配给愤怒启发条件的参与者在多个绩效指标上的表现要比分配给控制条件的参与者明显差。但是，我们发现同理心虚拟代理抵消了愤怒条件引起的绩效下降，以至于分配给移情虚拟代理和愤怒条件的参与者与在控制启发条件下的参与者的表现没有不同，并且比分配给参与者的参与者明显更好控制虚拟药物和愤怒启发条件。尽管移情减少了愤怒的负面影响，但我们没有发现移情虚拟药物会影响被分配到控制启发条件的参与者的表现的证据。通过引入计算同理心干预的框架并进行两乘两个阶乘设计随机实验，我们提供了严格的经验证据，即计算同理心可以抵消愤怒对创造性问题解决的负面影响。

translated by 谷歌翻译

Human Detection of Political Deepfakes across Transcripts, Audio, and Video

Matthew Groh , Aruna Sankaranarayanan , Andrew Lippman , Rosalind Picard

分类：人工智能

2022-02-25

超现实视觉效果的技术的最新进展引起了人们的关注，即政治演讲的深层视频很快将与真实的视频录制无法视觉区分。通信研究中的传统观念预测，当故事的同一版本被视为视频而不是文字时，人们会更频繁地跌倒假新闻。在这里，我们评估了41,822名参与者在一个实验中如何将真实的政治演讲与捏造区分开来，在该实验中，演讲被随机显示为文本，音频和视频的排列。我们发现获得音频和视觉沟通方式的访问提高了参与者的准确性。在这里，人类的判断更多地依赖于话语，视听线索比所说的语音内容。但是，我们发现反思性推理调节了参与者考虑视觉信息的程度：认知反射测试的表现较低与对所说内容的过度依赖有关。

translated by 谷歌翻译

Towards Unsupervised Visual Reasoning: Do Off-The-Shelf Features Know How to Reason?

Monika Wysoczańska , Tom Monnier , Tomasz Trzciński , David Picard

分类：计算机视觉 | 人工智能

2022-12-20

Recent advances in visual representation learning allowed to build an abundance of powerful off-the-shelf features that are ready-to-use for numerous downstream tasks. This work aims to assess how well these features preserve information about the objects, such as their spatial location, their visual properties and their relative relationships. We propose to do so by evaluating them in the context of visual reasoning, where multiple objects with complex relationships and different attributes are at play. More specifically, we introduce a protocol to evaluate visual representations for the task of Visual Question Answering. In order to decouple visual feature extraction from reasoning, we design a specific attention-based reasoning module which is trained on the frozen visual representations to be evaluated, in a spirit similar to standard feature evaluations relying on shallow networks. We compare two types of visual representations, densely extracted local features and object-centric ones, against the performances of a perfect image representation using ground truth. Our main findings are two-fold. First, despite excellent performances on classical proxy tasks, such representations fall short for solving complex reasoning problem. Second, object-centric features better preserve the critical information necessary to perform visual reasoning. In our proposed framework we show how to methodologically approach this evaluation.

translated by 谷歌翻译

H3WB: Human3.6M 3D WholeBody Dataset and Benchmark

Yue Zhu , Nermin Samet , David Picard

分类：计算机视觉

2022-11-28

3D human whole-body pose estimation aims to localize precise 3D keypoints on the entire human body, including the face, hands, body, and feet. Due to the lack of a large-scale fully annotated 3D whole-body dataset, a common approach has been to train several deep networks separately on datasets dedicated to specific body parts, and combine them during inference. This approach suffers from complex training and inference pipelines because of the different biases in each dataset used. It also lacks a common benchmark which makes it difficult to compare different methods. To address these issues, we introduce Human3.6M 3D WholeBody (H3WB) which provides whole-body annotations for the Human3.6M dataset using the COCO Wholebody layout. H3WB is a large scale dataset with 133 whole-body keypoint annotations on 100K images, made possible by our new multi-view pipeline. Along with H3WB, we propose 3 tasks: i) 3D whole-body pose lifting from 2D complete whole-body pose, ii) 3D whole-body pose lifting from 2D incomplete whole-body pose, iii) 3D whole-body pose estimation from a single RGB image. We also report several baselines from popular methods for these tasks. The dataset is publicly available at \url{https://github.com/wholebody3d/wholebody3d}.

translated by 谷歌翻译

PlaStIL: Plastic and Stable Memory-Free Class-Incremental Learning

Grégoire Petit , Adrian Popescu , Eden Belouadah , David Picard , Bertrand Delezoide

分类：计算机视觉 | 机器学习

2022-09-14

课堂学习学习需要可塑性和稳定性，以便在保留过去的知识的同时从新数据中学习。由于灾难性的遗忘，当没有内存缓冲区可用时，在这两个属性之间找到妥协尤其具有挑战性。主流方法需要存储两个深层模型，因为它们使用微调与以前的增量状态的知识蒸馏一起整合了新类。我们提出了一种具有相似数量参数但分布不同的方法，以便在可塑性和稳定性之间找到更好的平衡。遵循已经通过基于转移的增量方法部署的方法，我们在初始状态后冻结了功能提取器。最古老的增量状态的类对这种冷冻提取器进行训练，以确保稳定性。使用部分微调模型预测最近的类别以引入可塑性。我们提出的可塑性层可以纳入任何用于无内存增量学习的基于转移的方法，并将其应用于两种此类方法。评估是通过三个大型数据集进行的。结果表明，与现有方法相比，所有测试的配置中均获得了性能提高。

translated by 谷歌翻译

Optimal precision for GANs

Thibaut Issenhuth , Ugo Tanielian , Jérémie Mary , David Picard

分类：机器学习 | 人工智能 | (统计)机器学习

2022-07-21

在学习断开分布时，已知生成对抗网络（GAN）面临模型错误指定。实际上，从单峰潜伏分布到断开连接的连续映射是不可能的，因此甘斯一定会在目标分布支持之外生成样品。这提出了一个基本问题：最小化这些领域的衡量标准的潜在空间分区是什么？基于几何测量理论的最新结果，我们证明，最佳甘恩必须将其潜在空间构造为“简单群集” - 一个voronoi分区，其中细胞是凸锥 - 当潜在空间的尺寸大于大于的数量时模式。在此配置中，每个Voronoi单元格映射到数据的不同模式。我们在gan学习断开的歧管的最佳精度上得出了上限和下限。有趣的是，这两个界限具有相同的减小顺序：$ \ sqrt {\ log m} $，$ m $是模式的数量。最后，我们执行了几项实验，以表现出潜在空间的几何形状，并在实验上表明gan具有与理论相似的几何形状。

translated by 谷歌翻译

Instance-Aware Observer Network for Out-of-Distribution Object Segmentation

Victor Besnier , Andrei Bursuc , David Picard , Alexandre Briot

分类：计算机视觉

2022-07-18

关于观察者网络的最新工作显示出关于语义分割的分布（OOD）检测的有希望的结果。这些方法在精确定位图像（即异常）中的兴趣点上很难。这种限制是由于像素水平上细粒度预测的难度。为了解决这个问题，我们向观察者提供实例知识。我们通过利用实例掩码预测来扩展obsnet的方法。我们使用其他类别的对象检测器来过滤和汇总观察者预测。最后，我们预测图像中每个实例的唯一异常得分。我们表明，我们提出的方法准确地将三个数据集中的分布对象准确地分发对象。

translated by 谷歌翻译

Xplique: A Deep Learning Explainability Toolbox

Thomas Fel , Lucas Hervier , David Vigouroux , Antonin Poche , Justin Plakoo , Remi Cadene , Mathieu Chalvidal , Julien Colin , Thibaut Boissin , Louis Bethune

分类：机器学习 | 人工智能

2022-06-09

当今最先进的机器学习型号几乎无法审查。解释性方法的主要挑战是通过揭示导致给定决定的策略，通过表征其内部状态或研究基础数据表示来帮助研究人员开放这些黑匣子。为了应对这一挑战，我们开发了Xplique：一种用于解释性的软件库，其中包括代表性的解释性方法以及相关的评估指标。它与最受欢迎的学习库之一接口：Tensorflow以及其他图书馆，包括Pytorch，Scikit-Learn和Theano。该代码是根据MIT许可证获得许可的，可在Github.com/deel-ai/xplique上免费获得。

translated by 谷歌翻译

A Probabilistic Graph Coupling View of Dimension Reduction

Hugues van Assel , Thibault Espinasse , Julien Chiquet , Franck Picard

分类： (统计)机器学习

2022-01-31

大多数流行的尺寸降低（DR）方法（例如T-SNE和UMAP）是基于最大程度地减少输入和潜在成对相似性之间的成本。尽管被广泛使用，但这些方法缺乏明确的概率基础，可以充分了解其特性和局限性。在这个程度上，我们基于使用交叉熵的隐藏图耦合引入了一个统一的统计框架。这些图在输入和潜在空间中的观测值之间诱导了马尔可夫随机场依赖关系结构。我们表明，现有的成对相似性DR方法可以从我们的框架中检索到图形的特定选择。此外，这表明这些方法遭受了统计缺陷的影响，该缺陷解释了保存粗粒依赖性方面的性能不佳。我们的模型被利用并扩展到解决此问题的同时，在使用Laplacian eigenmaps和PCA绘制新链接时。

translated by 谷歌翻译

Natural language processing to identify lupus nephritis phenotype in electronic health records

Yu Deng , Jennifer A. Pacheco , Anh Chung , Chengsheng Mao , Joshua C. Smith , Juan Zhao , Wei-Qi Wei , April Barnado , Chunhua Weng , Cong Liu

分类：机器学习

2021-12-20

Systemic Lupus红斑（SLE）是一种罕见的自身免疫疾病，其特征是令人无法预测的耀斑和缓解的速度，具有不同的表现形式。狼疮性肾炎，SLE用于器官损伤和死亡率的主要疾病表现之一，是卢布斯分类标准的关键组成部分。因此，准确地鉴定电子健康记录（EHRS）中的狼疮性肾炎将使大型队列观察研究和临床试验有益于患者人口的表征对于招聘，研究设计和分析至关重要。可以通过程序代码和结构化数据来认可狼疮肾炎，例如实验室测试。然而，记录狼疮肾炎的其他关键信息，例如来自肾脏活检和先前的医学史叙事的组织学报告，需要复杂的文本处理，以从病理报告和临床笔记中挖掘信息。在这项研究中，我们开发了使用EHR数据识别鉴定狼疮肾炎的血管肾炎，而不使用自然语言处理（NLP）。我们开发了四种算法：仅使用结构化数据（基线算法）和使用不同NLP模型的三种算法的规则的算法。这三种NLP模型基于正则化逻辑回归，并使用不同的特征集，包括积极提及概念独特标识符（Cue），耐备的外观数量，以及三个部件的混合物。基线算法和最佳执行的NLP算法在Vanderbilt University Center（VUMC）的数据集上验证了外部验证。我们最佳地执行来自结构化数据，正则表达式概念和映射的特征的NLP模型，与基线狼疮性肾炎算法相比，在NMEDW（0.41 VS 0.79）和VUMC（0.62 VS 0.96）数据集中有所改善。

translated by 谷歌翻译